info

Ang Proyekto ng Google na Astra, Veo, at Gemini: Labanan ng mga Makabagong AI

Ito ang tugon ng Google sa OpenAI.

Isang pangkalahatang AI, isang AI na talagang magagamit araw-araw, nakakahiya namang magdaos ng press conference kung hindi ito ganito ngayon.

Sa madaling araw ng Mayo 15, opisyal na nagsimula ang taunang "Spring Festival Gala ng Teknolohiya" na Google I/O Developers Conference. Ilang beses bang nabanggit ang artipisyal na katalinuhan sa 110 minutong pangunahing Keynote? Nakalkula na ito ng Google:

Oo, ang AI ay pinag-uusapan bawat minuto.

Ang kumpetisyon ng generative AI ay kamakailan lamang umabot sa bagong rurok, at ang nilalaman ng I/O conference na ito ay natural na nakatuon sa artipisyal na katalinuhan.

"Isang taon na ang nakalipas sa entablado na ito, unang ibinahagi namin ang aming mga plano para sa katutubong multimodal na malaking modelo, Gemini. Ito ay nagmarka ng bagong henerasyon ng I/O," sabi ni Google CEO Sundar Pichai. "Ngayon, umaasa kami na makikinabang ang lahat sa teknolohiya ng Gemini. Ang mga makabagong tampok na ito ay sasapaw sa paghahanap, mga imahe, mga productivity tool, mga system ng Android, at marami pang ibang aspeto."

Sa kasalukuyan, parehong 1.5 Pro at 1.5 Flash ay available para sa pampublikong preview at nag-aalok ng 1 milyong token na konteksto sa Google AI Studio at Vertex AI. Ngayon, ang 1.5 Pro ay nag-aalok din ng 2 milyong token na konteksto para sa mga developer na gumagamit ng API at mga customer ng Google Cloud sa pamamagitan ng waiting list.

Bilang karagdagan, ang Gemini Nano ay pinalawak mula sa purong text input patungo sa image input. Mamaya sa taong ito, mula sa Pixel, ilulunsad ng Google ang multimodal Gemini Nano. Ibig sabihin nito, maaari na hindi lamang iproseso ng mga mobile user ang text input kundi maunawaan din ang higit pang kontekstuwal na impormasyon, tulad ng mga visual, tunog, at sinasalitang wika.

Ang pamilya ng Gemini ay tinatanggap ang isang bagong miyembro: Gemini 1.5 Flash

Ang bagong 1.5 Flash ay na-optimize para sa bilis at kahusayan.

Bagong Henerasyon ng Open Source na Malaking Modelo Gemma 2

Ngayon, naglabas din ang Google ng isang serye ng mga update sa open source na malaking modelo Gemma – nandito na ang Gemma 2.

Tulad ng ipinakilala, ang Gemma 2 ay gumagamit ng bagong arkitektura na naglalayong makamit ang mga makabagong pagganap at kahusayan, ang mga bagong open sourced na modelo ng parameter ay 27B.

Pagdating sa mahahabang video, ang Veo ay maaaring makagawa ng mga video na 60 segundo o mas mahaba. Magagawa ito sa pamamagitan ng isang solong prompt o sa pamamagitan ng pagbibigay ng serye ng mga prompt na sama-samang nagkukuwento. Ito ay susi para sa aplikasyon ng mga modelo ng pagbuo ng video sa produksyon ng pelikula at telebisyon.

Ang Veo ay batay sa gawain ng Google sa pagbuo ng visual na nilalaman, kabilang ang Generative Query Network (GQN), DVD-GAN, Image-to-Video, Phenaki, WALT, VideoPoet, Lumiere, at iba pa.